AI Intelligence Navigator · 2026-05-05

每天 5 分钟,知道 AI 圈真正值得看的变化。

每天 5 分钟,读懂 AI 圈真正值得看的变化。 这里不是原始链接仓库,而是经过清洗、去重、归类和价值判断的 AI 信息导航站。

565精选条目
484全文备份
7主题频道
112近期信号
Agent 与自动化 4.0 · 优秀

MCP-Flow: 自动构建大规模 MCP 工具数据集,让 0.6B 模型在工具调用上超越 GPT-4o

MCP-Flow 提出全自动 pipeline,从 6 个 MCP 市场自动抓取服务器配置,通过 Slot-Fill Revision + WizardLM Evolution 两阶段数据增强,产出 68733 对 instruction-function call(1166 服务器、11536 工具)。实验表明:GPT-4o 在 10 工具场景下 AST 仅 58.8%,100 工具时 Groq-8B AST 跌至 3%;而 MCP-Flow-Qwen3-0.6B 在同场景下 AST 达 81.2%,全面超越所有大模型。用 MCP-Flow 做 RAG 检索增强后,GPT-4o 在 GAIA 任务上成功率 +17%,步数减少 32%。

先看它的理由0.6B 小模型微调后在 MCP 工具调用上全面超越 GPT-4o,证明小模型+数据工程才是正确方向
mcptool-callingfine-tuningdatasetagent
Today

今日要闻

更多
Coding 4.0 · 优秀
Greg Brockman 详解 Codex 验证创业想法的 Skill

Greg Brockman 分享了一个 Codex Skill,可以对创业想法进行压力测试。用户只需输入创业想法,Codex 会自动找到核心假设、暴露致命缺陷、检查问题是否真实存在,并给出坦诚的批判性评估。这个 Skill 解决了一个常见痛点:大多数创业想法听起来都不错,但缺乏系统性的验证机制。对于独立开发者、天使投资人以及正在构思 MVP 的创业者,这个工具提供了一个低成本的初期验证手段,可以快速筛选出想法中的致命漏洞。

2026-05-04 · X · gdb
Models 5.0 · 必读
Google Gemini Embedding 2 多模态嵌入模型

Google推出的首个原生多模态嵌入模型,支持视频分析、视觉购物助手等多种应用场景,已向公众开放使用。

2026-05-03 · X · GoogleAI
Business 4.0 · 优秀
Pete Yang对话前Tinder CPO:构建AI产品的3层context系统

Pete Yang 与前 Tinder CPO Ravi Mehta 合作,提出构建有用 AI 产品的3层 context 系统:Functional 层(应用做什么)、Visual 层(应用长什么样)和 Context 层(当前交互上下文)。Pete 指出目前 AI 使用中最常见的错误是不主动管理 context——模型无法有效利用历史信息,导致输出质量下降。这套3层框架可帮助产品经理和开发者系统性地设计 AI 产品的信息架构,避免常见的信息流混乱问题,是一个可复用的产品方法论。

2026-05-03 · X · petergyang
Agents 3.0 · 值得看
OpenClaw 2026.5.2:插件安装更稳、Agent 热路径更轻

Peter Steinberger 转发 OpenClaw 2026.5.2 发布,重点是修复 npm 安装依赖与速度问题,让插件安装和更新更稳定,并把大部分能力迁入 extensions 以降低包体负担。发布同时提到 Gateway 与 agent hot path 精简,以及 Discord、Slack、Telegram、WhatsApp、TTS、Realtime、web search 等集成修复。

2026-05-03 · X · steipete
Business 4.0 · 优秀
OpenAI CFO Sarah Friar:建议将 IPO 推迟至 2027 年,正在管理 Sam Altman

华尔街日报对 OpenAI CFO Sarah Friar 的深度专访。知情人士透露,Friar 私下建议将 OpenAI IPO 推迟至 2027 年,以避免在 Anthropic 之前匆忙上市导致估值受损。她帮助维持了 OpenAI 与微软的关键合作关系,并正在管理 Sam Altman 的雄心与公司实际发展节奏之间的平衡。报道指出 OpenAI 正处于 11 年历史上最关键的发展阶段,走得太快可能透支业务,太慢则可能被 Anthropic 抢先。

2026-05-02 · 文章 · Lauren Thomas / Wall Street Journal
Sponsored slot 预留赞助位

只接受与 AI 工具、开发者服务、学习资源相关的赞助,并会明确标注。

了解合作方式
Models

模型与实验室

进入频道

GPT、Claude、Gemini、开源模型、模型能力边界。

4.0 · 优秀
xAI 发布 Grok 4.3:常驻推理、100万上下文、超低定价,附带语音克隆套件 Custom Voices

xAI 发布 Grok 4.3 模型,主打"常驻推理"(always-on reasoning)能力,具备 100 万 token 上下文窗口,API 定价仅为 Grok 4.20 的 60%(输入 $1.25/百万token,输出 $2.50/百万token)。在 Artificial Analysis Intelligence Index 上比 Grok 4.20 提升 4 分,以 500B 参数超越 Claude Sonnet 4.6。同时发布 Custom Voices 语音克隆套件,仅需 1 分钟语音样本即可生成可用的语音克隆。xAI 工程师表示更大规模的模型正在训练中。

2026-05-01 · 文章 · xAI
3.0 · 值得看
深度调研:Claude Code 最强配置单 · 9 个 GitHub 工具深度评测

调研时间: 2026-04-16 调研人: AI 助理(Subagent) 主题分类: AI 开发工具 / Claude Code 生态 --- Claude Code 已成为当前 AI 辅助编程的事实标准,而其真正的威力取决于周边工具链的搭配质量. 本次调研覆盖 9 款 GitHub 上与 Claude Code 强相关的工具与插件,按功能分为知识增强、技能增强、自动化设计三类. 核心结论:Superpowers 和 GSD 是本次评测中唯二达到"必装"标准的工具——前者重塑了软件工程的纪律与方法论,后者用原子化 subagent 执行模型根治了长会话

2026-05-01 · 文章
Agents

Agent 与自动化

进入频道

Agent 框架、MCP、A2A、工具调用、长期任务。

4.0 · 优秀
MCP-Flow: 自动构建大规模 MCP 工具数据集,让 0.6B 模型在工具调用上超越 GPT-4o

MCP-Flow 提出全自动 pipeline,从 6 个 MCP 市场自动抓取服务器配置,通过 Slot-Fill Revision + WizardLM Evolution 两阶段数据增强,产出 68733 对 instruction-function call(1166 服务器、11536 工具)。实验表明:GPT-4o 在 10 工具场景下 AST 仅 58.8%,100 工具时 Groq-8B AST 跌至 3%;而 MCP-Flow-Qwen3-0.6B 在同场景下 AST 达 81.2%,全面超越所有大模型。用 MCP-Flow 做 RAG 检索增强后,GPT-4o 在 GAIA 任务上成功率 +17%,步数减少 32%。

2026-05-04 · 论文 · TikTok & 上海交大联合研究
3.0 · 值得看
OpenClaw 2026.5.2:插件安装更稳、Agent 热路径更轻

Peter Steinberger 转发 OpenClaw 2026.5.2 发布,重点是修复 npm 安装依赖与速度问题,让插件安装和更新更稳定,并把大部分能力迁入 extensions 以降低包体负担。发布同时提到 Gateway 与 agent hot path 精简,以及 Discord、Slack、Telegram、WhatsApp、TTS、Realtime、web search 等集成修复。

2026-05-03 · X · steipete
3.0 · 值得看
Introducing Koog Integration for Spring AI: Smarter Orchestration for Your Agents

Introducing Koog Integration for Spring AI: Smarter Orchestration for Your Agents 英文原文 Introducing Koog Integration for Spring AI: Smarter Orchestration for Your Agents > 作者: @jetbrains > 发布时间: 2026-04-16 > 原文链接: --- ## JetBrains AI Supercharge your tools with AI-powered features inside many JetBrains products Follow - Follow: - _RSS_ RSS Explore More # Introducing Koog Integr...

2026-05-01 · 文章
Coding

AI 编程

进入频道

IDE、CLI、代码审查、工程工作流、开发者效率。

4.0 · 优秀
Greg Brockman 详解 Codex 验证创业想法的 Skill

Greg Brockman 分享了一个 Codex Skill,可以对创业想法进行压力测试。用户只需输入创业想法,Codex 会自动找到核心假设、暴露致命缺陷、检查问题是否真实存在,并给出坦诚的批判性评估。这个 Skill 解决了一个常见痛点:大多数创业想法听起来都不错,但缺乏系统性的验证机制。对于独立开发者、天使投资人以及正在构思 MVP 的创业者,这个工具提供了一个低成本的初期验证手段,可以快速筛选出想法中的致命漏洞。

2026-05-04 · X · gdb
3.0 · 值得看
Claude Code 向 Codex 的习惯迁移

串串狗小刊发布的一篇从 Claude Code 迁移到 Codex 的实践指南。文章对比了两个 AI 编程工具在日常使用中的差异,包括上下文管理、工具调用方式、权限模型等方面的区别,并分享了作者在实际项目中完成迁移的经验和踩坑记录。对于同时使用或考虑切换 AI 编程工具的开发者有直接参考价值。(原文抓取失败,基于 RSS 元数据提取)

2026-05-02 · 文章 · 串串狗小刊
Infra

基础设施

进入频道

推理、RAG、微调、评测、多模态、芯片和端侧部署。

3.0 · 值得看
Anthropic 正在与英国 AI 芯片初创 Fractile 洽谈采购推理芯片

据 The Information 报道,Anthropic 正在与英国 SRAM 基 AI 芯片初创公司 Fractile 进行早期洽谈,计划在 2027 年 Fractile 产品上市后采购其推理芯片。随着 Anthropic 销售额爆发式增长,现有服务器供应(来自 Google、Amazon、Nvidia)已面临压力。此举反映了 AI 公司正在积极多元化芯片供应链,以应对日益增长的推理算力需求。Fractile 的 SRAM 基方案代表了一种不同于传统 GPU 的推理加速路径。

2026-05-02 · 文章 · The Information
4.0 · 优秀
三星芯片利润暴涨近 50 倍至 53.7 万亿韩元,预警 2027 年供应缺口将进一步扩大

三星电子 Q1 营业利润 57.2 万亿韩元(约 386 亿美元),创历史新高,半导体部门贡献 53.7 万亿韩元,利润率超 70%,超过英伟达和台积电同期。三星已签多年期约束性合同锁定产能,警告 2027 年存储芯片供需缺口将比 2026 年更大。AI 数据中心对 HBM 的需求是核心驱动力。

2026-04-30 · 文章 · Reuters / Bloomberg
4.0 · 优秀
华为昇腾 AI 芯片 2026 年营收预计达 120 亿美元,同比增长 60%

华为预计 2026 年 AI 芯片营收约 120 亿美元,同比增长 60%。下一代昇腾 950PR 已进入量产,DeepSeek V4 发布后字节跳动、腾讯、阿里加速抢购。华为计划今年出货约 75 万颗 950PR。黄仁勋此前警告:如果 DeepSeek 新模型率先在华为芯片上全面适配,对美国在全球 AI 领域的战略地位将是灾难性打击。

2026-04-28 · 文章 · FT / HeyGoTrade
Business

产品与商业

进入频道

AI 产品、大厂战略、融资、监管、市场结构。

4.0 · 优秀
Pete Yang对话前Tinder CPO:构建AI产品的3层context系统

Pete Yang 与前 Tinder CPO Ravi Mehta 合作,提出构建有用 AI 产品的3层 context 系统:Functional 层(应用做什么)、Visual 层(应用长什么样)和 Context 层(当前交互上下文)。Pete 指出目前 AI 使用中最常见的错误是不主动管理 context——模型无法有效利用历史信息,导致输出质量下降。这套3层框架可帮助产品经理和开发者系统性地设计 AI 产品的信息架构,避免常见的信息流混乱问题,是一个可复用的产品方法论。

2026-05-03 · X · petergyang
4.0 · 优秀
OpenAI CFO Sarah Friar:建议将 IPO 推迟至 2027 年,正在管理 Sam Altman

华尔街日报对 OpenAI CFO Sarah Friar 的深度专访。知情人士透露,Friar 私下建议将 OpenAI IPO 推迟至 2027 年,以避免在 Anthropic 之前匆忙上市导致估值受损。她帮助维持了 OpenAI 与微软的关键合作关系,并正在管理 Sam Altman 的雄心与公司实际发展节奏之间的平衡。报道指出 OpenAI 正处于 11 年历史上最关键的发展阶段,走得太快可能透支业务,太慢则可能被 Anthropic 抢先。

2026-05-02 · 文章 · Lauren Thomas / Wall Street Journal
3.0 · 值得看
马斯克诉 OpenAI 案首周遭遇波折

马斯克对 OpenAI 的诉讼在首周审理中遭遇波折。据彭博社报道,庭审过程中出现多个不利信号。这起备受关注的案件被视为 AI 行业治理走向的风向标,涉及 OpenAI 从非营利向营利转型的合法性、创始团队的信义义务等核心问题。案件的走向将对整个 AI 行业的公司治理结构产生深远影响。

2026-05-02 · 文章 · Bloomberg
Research

研究与学习

进入频道

论文、课程、提示工程、长文、方法论。

5.0 · 必读
Andrew Ng新课:AI Prompting for Everyone

吴恩达(Andrew Ng)指出2026年的 Prompt 技巧与2022年 ChatGPT 刚发布时已截然不同。他新推出课程「AI Prompting for Everyone」,旨在帮助各种技能水平的用户成为AI power user。课程覆盖跨 ChatGPT、Gemini、Claude 等主流模型的通用 Prompt 技巧,强调如何针对不同模型特性优化 Prompt 策略。对于想系统提升 AI 使用效率的读者,这门跨模型的通用方法论比单一工具教程更有长期价值。

2026-05-01 · X · AndrewYNg
5.0 · 必读
Android 17 DeliQueue:二十年来最重要的消息队列架构重写

Android 17用lock-free混合数据结构DeliQueue替换了存在20年的MessageQueue实现。实际用户设备上实现丢帧率降低4%-7.7%、应用启动速度提升9.1%。这不是Binder IPC改造,而是对Android所有UI线程运行核心——Looper/Handler消息调度机制的根本性重构。每个应用的main线程、SystemUI、Launcher乃至system_server中的HandlerThread都依赖MessageQueue,这个单点性能改进具有全局传导效应。面向SDK 37及以上默认启用。

2026-04-10 · 文章 · Shai Barack, Charles Munger (Google)
Tools

工具与项目

进入频道

可直接尝试的工具、开源项目、产品更新和资源库。

4.0 · 优秀
OpenAI DevDay门票抽奖

使用GPT-5.5和Image Gen构建项目,每周选出2-3个最佳项目赢得免费DevDay 2026门票,提供实践AI前沿技术的机会。

2026-05-01 · X · OpenAI
3.0 · 值得看
深度调研:DroidClaw vs Open-AutoGLM

调研时间:2026-04-12 > 耗时:约 15 分钟 > 类型:对比分析(开源 Android AI Phone Agent) DroidClaw 和 Open-AutoGLM 是 2025-2026 年两个最具代表性的开源 Android AI Phone Agent 项目,均通过「感知屏幕 → LLM 推理 → ADB 执行」的循环实现手机自动化. 但二者在架构哲学、感知方式、模型策略、生态定位上差异显著:DroidClaw 走「轻量实用主义」路线——Bun/TypeScript、accessibility tree 为主、任意 LLM、旧机复用;O

2026-05-01 · 文章
3.0 · 值得看
从历史 Luddites 看反 AI 数据中心运动:1816 年的教训

Source: Sean Goedecke | 2026-04-23 URL: com/luddites-and-ai-datacenters/ > 注:原文抓取失败,此内容基于 RSS 摘要整理. Sean Goedecke's detailed analysis of historical Luddism based on multiple historical texts. Real Luddites were skilled craftspeople (7-year apprenticeships) whose trade was being

2026-05-01 · 文章
Deep Reads

深度阅读

全部
Agents 2026-05-04 · 论文
MCP-Flow: 自动构建大规模 MCP 工具数据集,让 0.6B 模型在工具调用上超越 GPT-4o

MCP-Flow 提出全自动 pipeline,从 6 个 MCP 市场自动抓取服务器配置,通过 Slot-Fill Revision + WizardLM Evolution 两阶段数据增强,产出 68733 对 instruction-function call(1166 服务器、11536 工具)。实验表明:GPT-4o 在 10 工具场景下 AST 仅 58.8%,100 工具时 Groq-8B AST 跌至 3%;而 MCP-Flow-Qwen3-0.6B 在同场景下 AST 达 81.2%,全面超越所有大模型。用 MCP-Flow 做 RAG 检索增强后,GPT-4o 在 GAIA 任务上成功率 +17%,步数减少 32%。

mcptool-callingfine-tuningdatasetagentsmall-model
4.0 · 优秀 开发者
Business 2026-05-02 · 文章
OpenAI CFO Sarah Friar:建议将 IPO 推迟至 2027 年,正在管理 Sam Altman

华尔街日报对 OpenAI CFO Sarah Friar 的深度专访。知情人士透露,Friar 私下建议将 OpenAI IPO 推迟至 2027 年,以避免在 Anthropic 之前匆忙上市导致估值受损。她帮助维持了 OpenAI 与微软的关键合作关系,并正在管理 Sam Altman 的雄心与公司实际发展节奏之间的平衡。报道指出 OpenAI 正处于 11 年历史上最关键的发展阶段,走得太快可能透支业务,太慢则可能被 Anthropic 抢先。

OpenAIIPOSarah Friar财务策略
4.0 · 优秀 产品/创业
Business 2026-05-01 · 文章
Meta 收购机器人 AI 初创 Assured Robot Intelligence,加入超级智能实验室

Meta 收购了 Assured Robot Intelligence(ARI),一家专注于为机器人开发 AI 模型的初创公司。ARI 团队将加入 Meta 超级智能实验室(MSL),与 Lerrel Pinto、Xiaolong Wang 等共同推进人形机器人智能。ARI 联合创始人表示,目标是将"能思考和说话的 AI"转变为"能行动的 AI",在物理世界中安全可靠地协助人类。此举是 Meta 在裁员 8000 人的同时加码物理 AI 和人形机器人赛道的重要布局。

Meta机器人人形机器人收购ARI
4.0 · 优秀 产品/创业
Business 2026-04-30 · 文章
哈佛研究:OpenAI o1 在急诊分诊中正确率 67%,超越医生的 50-55%

发表在 Science 上的哈佛研究显示,OpenAI 的 o1 推理模型在真实急诊场景中使用电子病历和护士简短描述进行诊断,正确率达到 67%,而分诊医生仅为 50-55%。在管理计划方面,AI 得分 89% 远超医生的 34%。研究者称这是"将重塑医学的深刻技术变革",但也强调 AI 应作为辅助工具而非替代医生,呼吁进行更大规模的前瞻性临床试验。论文同期被 NPR、Vox、CNET 等多家主流媒体广泛报道。

AI医疗OpenAIo1急诊诊断Science论文
5.0 · 必读 产品/创业
Infra 2026-04-30 · 文章
三星芯片利润暴涨近 50 倍至 53.7 万亿韩元,预警 2027 年供应缺口将进一步扩大

三星电子 Q1 营业利润 57.2 万亿韩元(约 386 亿美元),创历史新高,半导体部门贡献 53.7 万亿韩元,利润率超 70%,超过英伟达和台积电同期。三星已签多年期约束性合同锁定产能,警告 2027 年存储芯片供需缺口将比 2026 年更大。AI 数据中心对 HBM 的需求是核心驱动力。

samsungsemiconductorhbmai-infrastructuresupply-chain
4.0 · 优秀 开发者
Infra 2026-04-28 · 文章
华为昇腾 AI 芯片 2026 年营收预计达 120 亿美元,同比增长 60%

华为预计 2026 年 AI 芯片营收约 120 亿美元,同比增长 60%。下一代昇腾 950PR 已进入量产,DeepSeek V4 发布后字节跳动、腾讯、阿里加速抢购。华为计划今年出货约 75 万颗 950PR。黄仁勋此前警告:如果 DeepSeek 新模型率先在华为芯片上全面适配,对美国在全球 AI 领域的战略地位将是灾难性打击。

huaweiascendai-chipsemiconductorchina
4.0 · 优秀 开发者
Business 2026-04-28 · 文章
OpenAI 携 GPT-5.5 入驻 AWS Bedrock,结束微软七年独家云托管

OpenAI 与 AWS 联合宣布 GPT-5.5、Codex 编程代理及 Bedrock Managed Agents 进入有限预览。此前微软与 OpenAI 重签合作协议,取消 Azure 独家许可、废除 AGI 条款。GPT-5.4 已可调用,GPT-5.5 将在未来两周内上线。AWS 客户可通过现有 Bedrock API 调用 OpenAI 模型,复用统一的安全与治理框架。云计算 AI 模型市场从"独家绑定"转向"多平台分发"。

openaiawsbedrockgpt-5.5cloudmulti-cloud
4.0 · 优秀 产品/创业
Agents 2026-04-28 · 文章
MCP crossed 97 million monthly SDK downloads in March 2026

MCP(Model Context Protocol)2026 年 3 月 SDK 月下载量突破 9700 万次。该协议从 Anthropic 内部实验到 Linux 基金会 Agentic AI Foundation 托管仅用约 14 个月,速度超过任何已知开发者协议。文章提供生产级 MCP Agent 构建指南,涵盖服务器/客户端实现、安全策略和 2026 年路线图。

MCPModel Context ProtocolagenticAnthropicprotocol
4.0 · 优秀 开发者